從2023年的ChatGPT,到2024年的Sora橫空出世,大模型技術(shù)在短短一年內(nèi),給整個(gè)世界帶來(lái)了極強(qiáng)的震撼效應(yīng),但同時(shí)也帶來(lái)了很多亂象。
剛剛在5月末,史丹福大學(xué)的一個(gè)AI團(tuán)隊(duì),在全球最大的AI開(kāi)源社區(qū)HuggingFace上發(fā)布了一款名為Llama3-V的多模態(tài)大模型,被證實(shí)是抄襲清華系大模型創(chuàng)企面壁智能剛發(fā)布的開(kāi)源大模型,引起軒然大波,也將大模型「套牌」問(wèn)題引向了風(fēng)口浪尖。今年1月,國(guó)內(nèi)大模型打假維權(quán)還出現(xiàn)了首例勝訴判決。飛遊網(wǎng)絡(luò)假冒「通義千問(wèn)」的山寨APP、帳號(hào),還打著官方的旗號(hào)向用戶(hù)收費(fèi),因此被阿里雲、阿里巴巴起訴並勝訴。
相似的案例還有很多,自大模型時(shí)代到來(lái)之後,抄襲,山寨、套牌,假融資等等亂象紛至沓來(lái),在大模型時(shí)代的AI創(chuàng)新要站穩(wěn)腳跟,勢(shì)必要加速自主創(chuàng)新,堅(jiān)守本心,方能正道成功。
「百模大戰」一年,市場(chǎng)亂象頻出
過(guò)去一年,「百模大戰」讓大模型技術(shù)站上了市場(chǎng)「風(fēng)口」,和所有風(fēng)口上的技術(shù)一樣,不僅引來(lái)了資本和市場(chǎng)的追逐也引發(fā)了很多亂象。
首先,質(zhì)量和數(shù)量的矛盾始終伴隨著大模型的「井噴式」發(fā)展,一大批所謂AI創(chuàng)業(yè)公司,一味追逐熱點(diǎn),導(dǎo)致市場(chǎng)上的大模型多而不精,陳次不齊,同質(zhì)化嚴(yán)重。
公開(kāi)的數(shù)據(jù)顯示:截至於今年4月底,國(guó)內(nèi)共計(jì)推出了305個(gè)大模型;截至於5月16號(hào),大概有140個(gè)大模型完成了生成式人工智慧的服務(wù)備案。這種大模型數(shù)量的快速增長(zhǎng)多為盲目跟風(fēng),對(duì)大模型本身的創(chuàng)新毫無(wú)助益。
其次,套牌、造假和虛假宣傳事件縈繞不斷。一些公司為了快速實(shí)現(xiàn)融資或市場(chǎng)化的目的,將開(kāi)源大模型進(jìn)行「改造」後就冠以自有產(chǎn)品之名,也導(dǎo)致了國(guó)內(nèi)大模型原創(chuàng)性的缺失和智慧財產(chǎn)權(quán)等潛在問(wèn)題的隱患。
更有一些企業(yè),通過(guò)硬造技術(shù)術(shù)語、誇大價(jià)值等方式進(jìn)行宣傳,甚至將不是大模型技術(shù)的項(xiàng)目包裝成大模型,讓用戶(hù)陷入選擇困難。
第三,大模型同質(zhì)化,缺乏多樣性,導(dǎo)致應(yīng)用端效果欠佳。不少大模型採用同樣的數(shù)據(jù)集、訓(xùn)練方法等,導(dǎo)致輸(shū)出雷同的問(wèn)題答案,無(wú)法滿(mǎn)足多樣化的市場(chǎng)需求。同時(shí),高質(zhì)量數(shù)據(jù)的缺失,也嚴(yán)重製約著大模型的發(fā)展,這也是為什麼大模型「幻覺」問(wèn)題總是無(wú)法根除的原因之一。
第四,過(guò)度競(jìng)爭(zhēng),價(jià)格戰讓大模型創(chuàng)新陷入短視之局。經(jīng)歷長(zhǎng)達(dá)一年多的「百模大戰」,大模型行業(yè)迅速陷入價(jià)格亂戰。一些企業(yè)接連調(diào)整旗下大模型產(chǎn)品的定價(jià)策略,採取「直降97%」的按釐計(jì)價(jià)甚至「全面免費(fèi)」的策略,進(jìn)一步抑制了行業(yè)用戶(hù)對(duì)大模型的使用信心。
第五,刷分、打榜等無(wú)意義的「評(píng)測(cè)秀」充斥市場(chǎng)。有些大模型的開(kāi)發(fā)只關(guān)注短期利益,如「打榜刷分型大模型」和「結(jié)項(xiàng)為主型大模型」,它們不考慮應(yīng)用場(chǎng)景與後續(xù)更新,只追求短期的宣傳效果或結(jié)項(xiàng)成功,對(duì)整個(gè)行業(yè)的長(zhǎng)期發(fā)展造成傷害。
在風(fēng)口之上,這些亂象儘管很容易被忽視,但卻真實(shí)存在。我們相信,在風(fēng)口過(guò)後,必然是去偽存真的時(shí)候,唯有堅(jiān)持走自主創(chuàng)新的技術(shù)能夠活下來(lái),唯有原創(chuàng)的產(chǎn)品會(huì)獲得持續(xù)的發(fā)展。
AI創(chuàng)新要如何走向成功?
實(shí)際上,在大模型時(shí)代之前,AI的風(fēng)口已經(jīng)出現(xiàn)過(guò)好幾輪。每一次風(fēng)口的輪轉(zhuǎn),從波峰到波谷,都必然伴隨著市場(chǎng)的洗牌,大量的跟風(fēng)者和投機(jī)者被淘汰,真正創(chuàng)新的公司和技術(shù)才能穿越周期。
那麼從AI創(chuàng)新的角度,要如何才能走向成功?
首先,要制定全面而長(zhǎng)遠(yuǎn)的戰略規(guī)劃(huà),明確的AI發(fā)展戰略,包括短期、中期和長(zhǎng)期目標(biāo)。因為AI的技術(shù)變革速度極快,新的算法、框架、硬體和應(yīng)用不斷湧現(xiàn),長(zhǎng)期的規(guī)劃(huà)能夠堅(jiān)守清晰的方向,確保資源投入與技術(shù)趨勢(shì)相匹配。在面對(duì)大模型等技術(shù)風(fēng)口時(shí),更能站在自身發(fā)展策略的角度上,去調(diào)整技術(shù)方向和產(chǎn)品策略,不至於偏離目標(biāo)。
其次,賽道的選擇十分關(guān)鍵。以大模型為例,市場(chǎng)的機(jī)會(huì)是否屬於每一家大模型技術(shù)的提供商呢?答案顯然不會(huì)是肯定的。通用大模型的迭代速度飛快,GPT的演進(jìn)速度快的令人咋舌,國(guó)內(nèi)的通用大模型,仍舊保持傳統(tǒng)的創(chuàng)新模式,要追上GPT的創(chuàng)新步伐是非常不現(xiàn)實(shí)的。
所以,選擇垂直領(lǐng)域的大模型方向,這就是一個(gè)好的賽道選擇。以華為雲的盤(pán)古大模型為例,在政務(wù)、在礦山、在鐵路和氣象等領(lǐng)域的落地,證明了行業(yè)大模型比通用大模型,在現(xiàn)階段有更強(qiáng)的實(shí)際價(jià)值。
第三,要加強(qiáng)核心技術(shù)的自主研發(fā),打造更多原創(chuàng)性技術(shù)。因為擁有自主的核心技術(shù),企業(yè)才可以自主決定技術(shù)發(fā)展的方向,而不受外部供應(yīng)商或合作夥伴的限制,也可以避免技術(shù)依賴帶來(lái)的潛在風(fēng)險(xiǎn)。另外,從AI創(chuàng)業(yè)的角度,原創(chuàng)性是技術(shù)創(chuàng)新和突破的重要驅動(dòng)力,強(qiáng)調(diào)原創(chuàng)性是研發(fā)團(tuán)隊(duì)不斷挑戰現(xiàn)有技術(shù)邊界的根本。
當(dāng)然,加強(qiáng)原創(chuàng)性技術(shù)研發(fā),也會(huì)面臨成本和資源等問(wèn)題,這就需要有好的創(chuàng)新平臺(tái)來(lái)輔助開(kāi)發(fā)者。
華為雲其實(shí)已經(jīng)在構(gòu)建這種生態(tài),比如以華為雲昇騰AI雲服務(wù)為算力底座,目前華為雲已原生孵化自然語言、計(jì)算機(jī)視覺、多模態(tài)等5大基礎(chǔ)大模型,並與夥伴聯(lián)創(chuàng)多個(gè)行業(yè)大模型,已落地30多個(gè)行業(yè),為開(kāi)發(fā)者提供了強(qiáng)大的工具和資源;2023年,華為雲也上線(xiàn)昇騰AI雲服務(wù)百模千態(tài)專(zhuān)區(qū)和開(kāi)發(fā)者模型社區(qū),全面基於昇騰AI雲服務(wù)進(jìn)行適配和優(yōu)化,精度和性能顯著提升。
第四,邁向多元創(chuàng)新,而不是擠上大模型的獨(dú)木橋。其實(shí),不僅是大模型,中國(guó)人工智慧產(chǎn)業(yè)要發(fā)展,從算力、算法,到大模型、應(yīng)用都需要自主創(chuàng)新。這是有志於AI創(chuàng)新的中國(guó)企業(yè)的機(jī)會(huì),也是中國(guó)AI創(chuàng)新整個(gè)體系能夠做大做強(qiáng)的關(guān)鍵。
做中國(guó)AI創(chuàng)新的「沃土」
所有天馬行空的念頭,回歸到中國(guó)的AI創(chuàng)新,就一定要考慮到實(shí)際的落地場(chǎng)景,當(dāng)然就要面對(duì)「最後一公裡」的難題。每一個(gè)系統(tǒng)、每一處體驗(yàn)、每一段代碼的背後,都有開(kāi)發(fā)者的影子。
開(kāi)發(fā)者就像是整個(gè)AI創(chuàng)新系統(tǒng)中的「毛細(xì)血管」,補齊了落地的最後一公裡,讓生態(tài)活起來(lái)。開(kāi)發(fā)者也是深入基礎(chǔ)研究、補齊產(chǎn)業(yè)鏈短板、走向核心技術(shù)創(chuàng)新的關(guān)鍵力量。
華為雲一直有志於做開(kāi)發(fā)者的「沃土」,並以最新的技術(shù)做AI創(chuàng)新的「燈塔」。比如華為雲盤(pán)古大模型方面,華為雲已推出礦山、藥物分子、電力、氣象、海浪、鐵路、政務(wù)、金融、製造等多個(gè)行業(yè)的大模型,為業(yè)界貢獻(xiàn)了先進(jìn)的算法和解決方案。
據(jù)悉,華為開(kāi)發(fā)者大會(huì)(HDC 2024)6月21日-23日在東莞松山湖舉行,華為雲發(fā)布了盤(pán)古大模型5.0,仍然是本著「專(zhuān)為行業(yè)而生,致力於為行業(yè)客戶(hù)服務(wù),解決實(shí)際問(wèn)題」的理念,賦能千行萬(wàn)業(yè)的開(kāi)發(fā)者,做中國(guó)AI創(chuàng)新的「沃土」。
中國(guó)AI創(chuàng)新從「套牌」,走向正牌,其實(shí)需要的正是華為雲這種力量,以原創(chuàng)的精神,務(wù)實(shí)的風(fēng)格和對(duì)技術(shù)演進(jìn)的遠(yuǎn)見(jiàn),對(duì)行業(yè)場(chǎng)景的深刻理解,足以引領(lǐng)中國(guó)AI創(chuàng)新,更加貼近實(shí)用價(jià)值,更符合中國(guó)行業(yè)發(fā)展的需要。